home *** CD-ROM | disk | FTP | other *** search
/ Cream of the Crop 26 / Cream of the Crop 26.iso / educate / trutran2.zip / ARTICLE5 < prev    next >
Text File  |  1996-12-14  |  14KB  |  306 lines

  1.  
  2.               *** PRESS ANY KEY TO SEE THE NEXT SCREEN ***
  3.  
  4.          If you wish to print this article or view it in its
  5.          entirety, please load it into your word processor
  6.                           as ARTICLE5.
  7.  
  8.                    *********************************
  9.                    *    For an overview of these   *
  10.                    *  articles, please first read  * 
  11.                    *     the file ARTICLE0.SEE     *
  12.                    *********************************
  13.  
  14.  
  15.                   The Next Wave of MT Publicity
  16.  
  17.                           By Alex Gross
  18.  
  19.              (Originally published in the ATA Chronicle,
  20.                             July, 1994)
  21.  
  22.  
  23.      The year is 1986, and I am sitting on my floor with my
  24. hacker genius friend, whom I'll call Mike.  We are discussing the
  25. imminent wave of Artificial Intelligence programs which will soon
  26. take over the world and make us both vastly rich.  In this
  27. venture I will provide the practical knowledge, Mike the
  28. programming skills.  I am eager to put together a medical
  29. application, and Mike has some ideas of his own.  We both believe
  30. there is no limit to the power of AI to harness ideas, learning,
  31. knowledge.  Mike idly picks up a Roget's Thesaurus lying on my
  32. floor and leafs through it.
  33.      
  34.      "You see how easy it is, Alex" he tells me, "All we need is
  35. the French equivalent of this book, I link them together with a
  36. program, and bingo: perfect Machine Translation!"  I am hesitant
  37. and attempt to express my doubts.  I try to tell Mike that it
  38. isn't that simple, but he will have none of it.  He is supremely
  39. sure that language is a pushover, what programmers call a
  40. "trivial task."
  41.      
  42.      Mike never built his MT system, even though he did go on to
  43. write an award-winning AI application that came closer than any
  44. to passing the Turing Test (more about that test later).  So
  45. there is no doubt about his programming skills, nor those of many
  46. other programmers.  What remains in doubt is the capacity of
  47. these highly specialized technicians to assess the deepest
  48. problems connected with MT, AI, and NLP (Natural Language
  49. Processing) applications in general.
  50.      
  51.      Publicity about MT has come in waves.  The first wave was
  52. launched by Turing, Weaver, Shannon, and other computer pioneers.
  53. A later wave emanated from IBM around the time of the 1964
  54. World's Fair.  The most recent wave started in the mid-Eighties
  55. and has culminated in the various micro and mainframe systems now
  56. familiar to  us.  Each wave has publicized much the same
  57. arguments:
  58.      
  59.      1.  MT will be faster than human translators.
  60.      2.  MT will be more accurate than human translators.
  61.      3.  MT will be cheaper than HT (though more
  62.           recently this claim has been slurred over).
  63.      4.  MT will break the language barrier and open the
  64.           way to true and lasting human understanding (this
  65.           point has also been deemphasised of late, though
  66.           early enthusiasts greatly stressed it).
  67.      
  68.  
  69.      Soon the next wave of MT publicity will burst upon us, and
  70. the publicity mills are already gearing up. (1)  In a year or two we
  71. will be reading about the incredible breakthroughs achieved by
  72. the "CYC" project, a unique Natural Language Processing
  73. experiment using massive parallel processing to build the
  74. supposed eight to ten million links embedded in human language.
  75. CYC supposedly comprises an "EnCYClopedia" of what we have all
  76. learned about the world around us.  Once again all the familiar
  77. arguments about MT are likely to resurface.  Even though CYC is
  78. not an MT system in itself, any success it enjoys will certainly
  79. reach out to embrace MT and other branches of AI.
  80.      
  81.      There can be no doubt that the CYC project is an important
  82. one worthy of attention by all translators.  For this reason--and
  83. also because its home base is Austin, Texas--I have asked Peter
  84. Krawutschke to determine if it will be possible for a group of
  85. computer-oriented ATA members to look in on CYC while we are in
  86. Austin this October.  Perhaps it could also become possible for
  87. representatives of CYC to take part in our conference program.
  88.      
  89.      The arguments for and against MT seem to come and go in an
  90. almost cyclical fashion, and some translators have come to view
  91. this subject with apprehension.  But we need to pay attention to
  92. what is happening in MT and AI in general.  Two unassailable
  93. arguments in its favor remain: 1) no one opposes MT where it
  94. really works, and 2) MT works quite well for those tasks where it
  95. is suitable.  The main questions concern which tasks these may
  96. be, whether their number may grow, and how translators will come
  97. to be integrated into the overall continuum of MT, Computer
  98. Assisted Translation, and traditional techniques.
  99.      
  100.      But as my friend Mike's attitude towards language shows,
  101. there are still some larger concerns about MT, which have dogged
  102. its development from its very beginnings and remain very much
  103. with us.  Underlying the basic assumptions of MT are much the
  104. same notions often vocalized as "Why don't you just type it out
  105. in Spanish?" or "Just look at it and say it in English."  What MT
  106. shares with such solecisms is the notion that the differences
  107. between two languages can easily be predicted and routinized.
  108. Noam Chomsky's concepts of "deep structure" or "universal
  109. grammar" reflect the same fallacies, in this case beefed up with
  110. many layers of academic terminology.  Basic to all these
  111. approaches is the half-truth that language is inherently
  112. reasonable, which must be balanced against the other half-truth,
  113. that it is not reasonable at all.  It is altogether possible--as
  114. I have argued elsewhere (2)--that on an evolutionary plane language
  115. may be at least partially an outgrowth of the spray marks used by
  116. animals to claim territory, attract mates, or repel rivals.
  117.      
  118.      Similarities between MT and other coequal branches of AI--
  119. "voice-writing," text retrieval, robotics, Machine Vision--also
  120. cannot be overstressed: all have fallen behind schedule for
  121. closely related reasons.  Voice-writing--which was originally
  122. supposed to catch every nuance of speech automatically--has now
  123. settled for asking the speaker to confirm or correct it following
  124. every word or phrase.  Text retrieval has still not fully
  125. recovered from the ambitious claims made surrounding its birth.
  126. One thing the computer does best is to match up strings of text,
  127. though this was never strictly speaking "AI."  But anything less
  128. than a perfect match requires what is called a "fuzzy search,"
  129. which in turn often produces vast quantities of "quasi-results"
  130. requiring highly qualified humans to determine their relevance.
  131. This means we are still a long way from truly reliable research
  132. based on a given text base.  This is because searching according
  133. to "key-words" is only as accurate as the key-words which have
  134. been entered.  In other words, a search through a legal data base
  135. under the heading "Teenage Abortion" will not find:
  136.      
  137.      JUDGE:  Did you have the baby?
  138.      REPLY:  No, I decided not to.
  139.      
  140.      Robotics, envisioned as supplying us all with unlimited
  141. household servants, did not even succeed completely in taking
  142. over the factory floor--rather, the factory floor had to be
  143. redesigned from scratch to allow robots to work.  And one still
  144. hears the story of the two Japanese welding robots who during a
  145. lull have been known to start welding each other.  Even Isaac
  146. Asimov, the father of Robotics, expressed his disappointment that
  147. these machines were not robots as he envisioned them.  And as for
  148. Machine Vision, how many people are ready to have a computer make
  149. the next left turn for them, much less drive them off into the
  150. sunset?
  151.      
  152.      Like Asimov, even AI's primary advocate, Marvin Minsky, has
  153. taken to writing science fiction to promote his ideas, which
  154. begin to sound indeed more and more like SF and less like viable
  155. proposals.  And even Minsky is now hedging on the future of MT,
  156. as this account of instant Japanese-English interpreting from his
  157. The Turing Option (co-authored with Harry Harrison) illustrates:
  158.      
  159.      "He touched the phone disconnect button and the voxfax
  160.      machine behind him instantly sprang to life, humming lightly
  161.      as it disgorged the printed record of their phone
  162.      conversation.  His words were in black, while Mura's were in
  163.      red for instant identification.  The translation system had
  164.      been programmed well, and as he glanced through it he saw no
  165.      more than the usual number of errors.....The staff
  166.      translator would later verify the correctness of the
  167.      translation the computer had made." (3)
  168.      
  169.      Of course this wondrous machine had already made a real-time
  170. onscreen "rough," though some may wonder what "the usual number
  171. of errors" was and how the protagonist recognized them without
  172. himself being an expert translator.  (And if he were, why would
  173. he have needed this device in the first place?)
  174.      
  175.      Thus, even science fiction has partially given up on old-
  176. fashioned, red-blooded AI.  The whole point of the Turing Test
  177. was to make a computer so lifelike that those communicating with
  178. it via keyboard from another room would actually believe they
  179. were talking to a human.  No machine has yet fully passed this
  180. test, which has since been subjected to many doubts and
  181. objections--even Alan Turing himself never supposed such a ruse
  182. could be maintained for more than a few minutes (4).  And so the
  183. days of the completely human computer may belong to the past
  184. rather than the future, except for those who believe that all
  185. sci-fi alternate futures are equally true.
  186.      
  187.      No doubt some readers will regard this fairly accurate
  188. description of the state of AI art as a sacrilege, as a certain
  189. religious element has come to creep into some discussions about
  190. the computer.  Those who venture any skepticism at all--critics
  191. like Hubert Dreyfus or John Searle or Joseph Weizenbaum--have
  192. sometimes been dismissed as simple-minded "Luddites," though
  193. recent research has shown that the true Luddites were far from
  194. simpletons (5).  Some of our experts seem so wedded to their vision
  195. of themselves as the shapers of the future that they are unable
  196. to notice any shortcomings in their outlook.
  197.      
  198.      Engineering has often succeeded by breaking down large
  199. problems into smaller pieces, finding the solution for each one,
  200. and then fitting the pieces back together again.  If this
  201. approach appears to fail, it can only be that the pieces were not
  202. made small enough--or perhaps inadequate funding.  If massive
  203. parallel processing fails to solve the problem, Neural Nets or
  204. Markov Models or DNA-etched microchips or nanotechnological brain
  205. implants are sure to take care of it.  The notion that language
  206. may not be susceptible to these approaches--that its semantic-
  207. contextual patterns may still fall through the holes of their
  208. mapping methods--is a foreign one for many computer scientists.
  209.      
  210.      As the coming flood of MT, AI, and NLP rhetoric breaks over
  211. our heads once again, it is perhaps important that we all of us
  212. recognize it for what it is: often little more than a form of
  213. advertising.  There are also some grounds for supposing that
  214. translators are not even supposed to hear any of this.  The real
  215. target for all the shouting is probably a combination of MIS
  216. directors (Management Information Services), office managers, and
  217. other executives in large corporations (6).  These highly paid
  218. officers usually know next to nothing about language or
  219. translation and little enough about computers.  What many of
  220. these MT vendors will be selling is not so much "Translating A
  221. Foreign Language" as "The Idea Of Translating A Foreign
  222. Language."
  223.      
  224.  
  225. NOTES:
  226.  
  227.      1 CYC-O, Doug Lenat's Quixotic Quest to Create an Artificial
  228. Intelligence with Common Sense, Interview by Jeffrey Goldsmith,
  229. WIRED, April, 1994, p. 94.
  230.  
  231.      2 Language and MT: Conflicting Technologies? Scitech
  232. Translation Journal, October 1993.
  233.  
  234.      3 Minsky, Marvin & Harrison, Harry: The Turing Option,
  235. p. 6, Warner Books, 1993.
  236.  
  237.      4 Unlike some of his followers, Turing was quite relaxed
  238. about this test and foresaw nothing more startling than that "an
  239. average interrogator will not have more than 70 per cent chance
  240. of making the right identification after five minutes of
  241. questioning."  Elsewhere he waxed whimsical and proposed that the
  242. computer should try to deceive an interrogator by pretending to
  243. be a woman, while a real woman would make the same claims from
  244. another room.  Thus, the so-called Turing Test, intended to
  245. identify "true AI," is not--unlike many testing procedures in the
  246. physical and even biological sciences--constructed in a rigorous
  247. way.  (Andrew Hodges: Alan Turing: the Enigma, pp. 415-17,
  248. Touchstone Books, Simon and Schuster, 1983).
  249.  
  250.      5 Whole Earth Review: Robert Rossney, The New Old Luddites,
  251. Spring, 1994, pp 2-12; Reid, R.W: Land of Lost Content: the
  252. Luddite Revolt, 1812, Heinemann, 1986.
  253.  
  254.      6 Perhaps symptomatic of this movement, a magazine called
  255. Multilingual Computing has been in existence for over a year,
  256. though very few copies have reached translators.  Slick and well-
  257. written on its own level, it is evidently directed towards a
  258. corporate audience from a small town in Idaho.  For more
  259. information, contact: Multilingual Computing, 111 Cedar Street,
  260. Suite 5, Sandpoint, Idaho 83864, Tel: (208) 263-8178, Fax (208)
  261. 263-6310.
  262.           
  263.             Copyright, 1994 and 1995 by Alexander Gross
  264.  
  265.                            This piece may be reproduced for
  266.                            individuals and for educational
  267.                            purposes.  It may not be used for
  268.                            any commercial (i.e., money-making)
  269.                            purpose without written permission
  270.                            from the author.
  271.  
  272.  
  273.  
  274.  
  275.  
  276.  
  277.  
  278.  
  279.  
  280.  
  281.  
  282.  
  283.  
  284.  
  285.  
  286.  
  287.  
  288.  
  289.  
  290.  
  291.  
  292.  
  293.  
  294.  
  295.  
  296.  
  297.  
  298.  
  299.  
  300.  
  301.  
  302.  
  303.  
  304.  
  305.  
  306.